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$8 3e: 降水 量 预 测 是 现代 气候 预测 业务 的 核心 和 难点 。 耦 合 模型 在 新 疆 降水 量 预 测 的 研究 应 用 屈指 可 数 , 因 


此 ,通过 尝试 建立 集合 经 验 模 态 分 解 (Ensemble Empirical Mode Decomposition , EEMD) PIK 4 H 


记忆 神经 网 络 


(Long Short-Term Memory Network , LSTM ) 的 耦合 模型 对 天 山北 坡 经 济 带 降水 量 进行 预测 研究 。 将 1965 一 2019 年 天 
山北 坡 经 济 带 共 55 a 的 年 降水 量 数据 进行 EEMD 分解, 转换 成 4 个 平稳 分 量 和 趋势 项 ,通过 谱 分 析 得 出 各 个 分 量 的 
准 周 期 ,为 后 续 训 练 LSTM 模型 提供 基础 。 根 据 EEMD 分 解 后 的 各 分 量 训练 得 出 LSTM 网 络 模型 并 利用 该 模型 进行 
研究 区 降水 量 预测 。 结 果 表 明 :EEMD-LSTM 耦合 模型 预测 2010—2019 年 天 山北 坡 经 济 带 降水 量 的 平均 相对 误差 
为 13.38% , 均 方 根 误差 为 38.03 mm, 认为 EEMD-LSTM 耦合 模型 对 天 山北 坡 经 济 带 降水 量 预测 精度 较 好 。 利 用 


EEMD-LSTM 耦合 模型 预测 2020 一 2029 年 天 山北 坡 经 济 带 匀 


F 降 水 量 , 其 中 有 6 a 降水 偏 多 ,4 a 降水 偏 少 ,2025 年 可 


能 为 极端 湿润 年 ,降水 偏 多 超过 20% ;而 2021 年 为 极端 干旱 年 ,降水 量 预计 低 于 200 mm。 本 文 探 索 了 干旱 区 降水 


气候 预测 是 气象 业务 的 核心 与 重点 " ,其 中 降 
水 量 预测 由 于 降水 事件 的 随机 性 和 不 确定 性 ,难度 
较 大 。 目 前 降水 量 预 测 的 方法 主要 有 统计 预测 和 
数值 模式 预测 ,对 于 年 际 和 年 代 际 降水 量 预测 的 主 
流 方法 仍然 是 统计 学 方法 ”。 当 前 国内 学 者 在 年 降 
水 量 的 预测 领域 已 经 积累 了 大 量 的 研究 成 果 ,传统 
的 统计 学 方法 如 : 自 回归 滑动 平均 (Auto-Regressive 
Moving Average, ARMA ) 模 型 3 小波 分 析 拓 等 已 经 
不 能 满足 降水 量 预 测 业 务 的 需求 , 随 着 信和 号 技术 和 
机 需 学 习 的 发 展 , 年 降水 量 的 预测 研究 集中 在 了 集 
合 经 验 模 态 分 解 (Ensemble Empirical Mode Decom- 
position, EEMD) IRA THAW p". 不管 是 
传统 方法 还 是 新 技术 ,都 是 利用 单一 模型 进行 降水 
量 的 预测 ,由 于 单一 模型 的 局 限 性 ,预测 的 准确 率 
和 精度 都 存在 一 定 缺 陷 ,预测 效果 不 理想 。 为 此 将 
EEMD 和 人 工 神经 网 络 相 结合 的 预测 方法 ,能 有 效 
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量 预 测 的 新 方法 ,并 为 气象 防 灾 减 灾 工 作 提供 参考 依据 。 


关键 词 : 集合 经 验 模 态 分 解 ; 长 短期 记忆 网 络 ; 年 降水 量 ; 预测 


的 弥补 单一 模型 的 不 足 ,并 且 非 常 适合 降水 量 这 一 
非 平稳 , 非 线 性 气象 要 素 的 预测 中 ;其 中 EEMD 分 解 
可 以 将 非 平 稳 时 间 序 列 转换 为 平稳 的 本 征 模 态 函 
数 分 量 ; 人工 神 经 网 络 方法 又 能 较 好 的 拟 合 非 线 性 

天 山 是 世界 干旱 区 独 具 特 色 的 山系 ,其 拦截 了 
西风 气流 携带 的 水 汽 ,形成 了 较为 丰沛 的 山区 水 资 
源 " 引 ,由 于 天 山 山区 复杂 的 地 形 地 貌 特征 ,气象 站 
点 稀少 且 分 布 不 均 给 降水 量 预测 研究 带 来 了 极 大 
的 困难 。 天 山北 坡 经 济 带 位 于 天 山北 区 ,是 新 疆 经 
济 最 发 达 ,资源 最 优越 的 地 区 ,同时 作为 丝绸 之 路 
经 济 带 的 重要 枢纽 ” ,其 水 资源 分 配 不 均 . 旱 涝 灾 
害 频 发 等 问题 制约 着 当地 的 发 展 呈 ,因此 ,提升 天 
山北 坡 经 济 带 降水 量 预测 的 准确 率 , 对 该 区 域 的 生 
产生 活 具 有 重要 的 应 用 价值 。 

目前 ,基于 EEMD 和 人 工 神经 网 络 的 耦合 模型 
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对 新 疆 年 降水 量 的 预测 研究 还 尚未 展开 ,本 文 根 据 
获取 的 研究 资料 .计算 机 响应 速度 等 因素 ,选取 了 
人 工 神经 网 络 模型 中 更 适 于 时 间 序 列 预测 的 长 短 
期 记忆 (Long Short-Term Memory ,LSTM ) 网 络 模 型 ， 
并 参考 印 浩 "构建 的 预测 商品 价格 的 EEMD-LSTM 
模型 ,建立 了 新 疆 天 山北 坡 经 济 带 EEMD-LSTM 年 
降水 量 耦 合 模型 ,对 该 区 域 2020 一 2029 年 年 降水 量 
进行 预测 ,并 对 模型 进行 评估 , 旨 在 为 改进 区 域 降 
水 量 预测 模型 提供 新 的 参考 ,同时 也 为 该 区 域 的 水 
资源 开发 利用 、 气 象 防 灾 减 灾 等 提供 决策 依据 。 


1 数据 与 方法 


1.1 数据 来 源 与 处 理 

本 文选 取 了 天 山北 坡 经 济 带 中 16 个 气象 站 点 
(图 1),1965 一 2019 年 共 55 a 的 逐 月 降水 量 数据 , 通 
TD UA (ECRIRE TELUET T RUE TER AEG TE 2 
基础 数据 资料 ,再 将 各 站 资料 平均 后 的 年 降水 量 序 
列 数据 进行 EEMD 分 解 ,分 析 各 分 量 信息 特点 ,最 后 
预测 2020 一 2029 年 的 年 降水 量 。 气 象 数据 来 源 于 
新 疆 气 象 局 气象 信息 中 心 ,高程 数据 来 源 于 通用 大 
洋 水 深 制图 (General Bathymetric Chart of the Oceans , 
GEBCO) 网 站 (https://www.gebco.net/) 的 全 球 海洋 和 
陆地 地 形 模型 网 格 数据 集 (CEBCO_2020 Grid)。 
1.2 研究 方法 
1.2.1 集合 经 验 模 态 分 解 经验 模 态 分 解 EMD 
(Empirical Mode Decomposition ) 是 一 种 处 理 非 平稳 
时 间 序 列 的 信号 学 方法 ,而 集合 经 验 模 态 分 解 
(EEMD ) 是 在 经 验 模 态 分 解 的 基础 上 通过 插入 高 斯 
白 噪 声 序列 ,有 效 抑制 了 EMD 方法 中 出 现 的 边缘 效 
应 和 尺度 混合 现象 ” ,使 最 终 分 解 的 本 征 模 态 函 数 
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IMF (Intrinsic Mode Function) 分 量 保 持 了 物理 上 的 
唯一 性 ,由 于 该 方法 无 需 预 先 设 定 任 何 基 函数 , 同 
时 添加 的 白 噪声 幅 值 对 最 终结 果 的 影响 较 小 ,因此 
该 方法 具有 较 好 的 适应 性 呈 。 降 水 量 的 变化 是 气 
候 变 化 的 具体 体现 之 一 ,通过 对 降水 量 序列 进行 
EEMD 分 解 得 到 的 各 IMF 分 量 隐藏 在 降水 量 序列 中 
的 不 同时 间 尺 度 的 气候 振荡 信号 ,而 趋势 项 分 量 则 
反映 了 降水 量 的 变化 趋势 情况 。 分 析 降 水 量 各 IMF 
分 量 序列 的 准 周期 信息 ,可 以 获取 降水 量变 化 的 内 
在 规律 ,为 降水 量 的 预测 工作 提供 基础 。 
EEMD 基本 步骤 如 下 : 
首先 ,给 原始 信号 o) 加 人 一 组 新 的 白 噪声 序 
列 ext) ,得 到 新 信号 序列 为 X@) ,如 公式 (1): 
X(t) 2 x(1) + oð (1) 
其 次 ,对 XGO 进行 EMD 分 解 ,得 到 一 组 IMF 分 
量 , 如 公式 (2): 
X(t) 2 3 MF (t) +r) (2) 
式 中 : MF (t) 表示 第 7 个 IMF 分 量 ; re) 为 趋势 项 。 
然后 对 原始 信号 重复 前 两 个 步 又 m 次 ,每 次 都 
加 入 不 同 的 白 噪声 ,得 到 一 组 新 的 IMF 分 量 , 如 公式 
(3) 所 示 : 


X(t) = IMF (t) ro) (3) 
将 每 次 得 到 的 IMF 分 量 进行 集成 均值 ,使 如 入 
的 白 噪 声 互 相抵 消 , 作 为 最 终结 
经 过 上 述 的 4 个 步骤 ,可 得 到 各 个 尺度 上 的 本 
征 模 态 函数 。 
1.2.2 LSTM 网 络 LSTM 网 络 是 循环 神经 网 络 的 一 
种 变形 结构 ,能 够 很 好 地 挖掘 数据 信息 传递 中 的 长 
期 依赖 关系 ,可 以 有 效 缓 解 循环 神经 网 络 训练 时 
的 梯度 消失 问题 。LSTM 网 络 的 单元 结构 如 图 2 所 
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图 1 研究 


区 示意 图 


Fig. 1 Schematic diagram of research area 
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图 2 LSTM 网 络 单元 结构 
Fig.2 Unit structure of LSTM neural network 


示 , 包 括 遗 忘 门 .输入 门 输出 门 以 及 单元 状态 信息 
传递 部 分 ,左右 两 侧 是 时 间 顺 序 中 相同 结构 的 循环 
单元 。 图 2 中 的 a tanh 分 别 表示 以 sigmoid 和 双 
正切 函数 ,为 激活 函数 的 非 线 性 神经 元 。 这 些 神经 
元 的 组 合 和 运算 (单元 中 圆圈 部 分 ) 实 现 了 门 控制 
功能 ,并 将 运算 结果 传递 给 下 一 个 单元 结构 。 从 下 
往 上 看 ,输入 与 输出 之 间 存 在 非 线 性 激活 函数 , 确 
保 神 经 网 络 能 够 通 近 任意 非 线性 函数 哺 ;从 左 往 右 
看 ,每 个 时 刻 的 输入 都 能 留存 在 网 络 中 且 对 下 一 时 
刻 产 生 影响 ,完成 长 短期 记忆 的 传递 。 

1.2.3 评价 指标 ”选用 观测 值 与 预测 值 之 间 的 均 方 
根 误差 RMSE ,平均 相对 误差 MRE 、 预 测 精确 度 P 以 
及 距 平 同 号 率 作为 模型 的 评价 指标 ”3, 计 算 公 式 
如 下 所 示 : 


z ODD XS as 
RMSE- m 240 f, (4) 
is 
MRE- (5) 
2 x 
LYl.-5| 
P=|1- 下 x 100% (6) 
225) 


公式 (4)~ 公 式 (6) 中 : y, 为 :时刻 的 观测 值 ; 9, 为 ! 时 
刻 的 预测 值 。 


2 结果 与 分 析 


2.1 EEMD-LSTM 耦 合 模型 的 构建 思路 
论文 采用 EEMD-LSTM 耦合 模型 进行 天 山北 坡 
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经 济 带 年 降水 量 的 预测 。 上 有 具体 的 建 模 步 又 包括 : 
(1) 对 天 山北 坡 经 济 带 年 降水 量 数据 进行 EEMD 分 
解 ,.(2) 将 EEMD 分解 后 的 各 分 量 序列 进行 数据 集 
的 划分 。 将 1965 一 1999 年 的 分 量 数据 作为 训练 集 ， 
2000—2009 年 的 分 量 数据 作为 验证 集 ,2010 一 2019 
年 的 分 量 数据 作为 测试 集 。(3) 将 各 分 量 数据 进行 
离 差 标准 化 处 理 , 得 到 归 一 化 数据 。(4) 进行 LSTM 
网 络 的 训练 ,确定 网 络 的 结构 .参数 与 超 参数 。 利 
用 训练 集 数据 训练 LSTM 网 络 ,该 网 络 结构 由 输入 
层 .隐藏 层 和 输出 层 的 结构 共同 决定 ,其 中 输入 层 
和 输出 层 的 结构 由 特征 维度 和 序列 的 时 间 步 长 决 
定 。LSTM 网 络 的 基础 参数 由 监督 式 学 习 训 练 生 
成 ,而 隐藏 层 神经 元 数量 .迭代 次 数 ,Dropout 等 超 参 
数 通过 试 凑 实 验 确 定 。(5) 利用 测试 集 数据 评估 
EEMD-LSTM 耦合 模型 的 性 能 。 利 用 训练 好 的 模型 
预测 研究 区 2010 一 2019 年 的 降水 量 ,通过 与 原 数 据 
对 比 , 评 估 天 山北 坡 经 济 带 年 降水 量 EEMD-LSTM 
耦合 模型 的 优 劣 ,(6) 利用 EFEMD-LSTM 耦合 模型 进 
行 天 山北 坡 经 济 带 2020 一 2029 年 降水 量 的 预测 。 
2.2 天 山北 坡 经 济 带 降 水 量 的 预测 
2.2.1 天 山北 坡 经 济 带 降水 量 EEMD 分 解 对 
1965—2019 年 天 山北 坡 经 济 带 年 均 降 水 量 序列 进 
行 EEMD 分 解 , 得 到 了 4 个 IMF 分 量 和 1 个 趋势 变化 
分 量 RES( 图 3)。 

EEMD 分 解 后 的 各 分 量 包含 了 原 序 列 中 不 同时 
间 尺 度 的 信息 ,同一 时 间 段 各 分 量 信息 的 总 和 为 原 
有 序列 的 相应 表征 ,各 分 量 所 含 实际 物理 意义 的 多 
少 可 以 通过 显著 性 检验 判断 ”…。 从 1965 一 2019 年 
天 山北 坡 经 济 带 年 降水 量 EEMD 分 解 后 各 分 量 的 显 
著 性 检验 结果 可 知 (图 4)。IMF, 分 量 在 90% 置 信 线 
上 ,包含 的 信息 最 为 显著 ,而 其 他 分 量 均 在 50% 的 
rfe EA TF ,认为 其 他 分 量 包 含 的 信息 相对 较 少 ， 
但 其 仍然 参与 了 方差 贡献 率 的 计算 ,保持 了 信号 的 

根据 谱 分 析 计 算 各 分 量 的 准 周期 ,而 各 分 量 的 
频率 与 振幅 对 原始 数据 的 影响 程度 可 以 用 方差 贡 
献 率 表示 ,由 图 3 和 表 1 可 知 , 准 周期 为 2.9 a 的 
IMF, 分 量 方差 贡献 率 为 54.54% ,振荡 信号 非常 显 
著 ;IMF, 准 周期 为 7.5 a, 方 差 贡 献 率 为 15.70% ,分 别 
在 1975 一 1985 年 和 2003 一 2013 年 出 现 了 两 个 相对 
平稳 的 时 期 ;IMF; 分 量 的 准 周 期 为 16 a, 方 差 贡献 率 
H 71.1596 ,分量 振 幅 随 着 时 间 推 移 呈 现 逐 渐 减 小 的 
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图 3 1965 一 2019 年 天 山北 坡 经 济 带 降水 量 年 际 变化 的 EEMD 分解 
Fig. 3 EEMD decomposition of interannual variation of precipitation in the Northern Slope Economic 
Belt of Tianshan Mountains from 1965 to 2019 


or 趋势 ;IMF, 振 幅 在 10 个 单位 左右 变化 ,方差 贡献 率 

E 仅 有 0.45%; 趋 势 项 的 方差 贡献 率 为 20.15%, 人 研究 区 
E 年 降水 量变 化 呈现 出 增 速 不 断 减 组 的 上 升 趋势 。 

新 疆 地 区 的 水 汽 主 要 源 自 于 地 中 海 .北大 西洋 

g 和 北冰洋 29 ,在 西风 的 输送 下 到 达 天 山北 坡 ,水 汽 

a -8r 输送 过 程 主要 受到 北极 涛 动 (Arctic Oscillation, AO) 

_10| 与 北大 西洋 涛 动 (North Atlantic Oscillation ,NAO ) 的 

M 影响 55 ,因此 ,天 山北 坡 的 降水 准 周期 与 AO .NAO 

-  - x aa H6 78] I FE — EHE , T GC" EXE NAO $ AO 

存在 准 8a 的 周期 ,AO 还 存在 准 16 a 的 年 代 际 周 

a nt 期 。 关 学 锋 叫 也 发 现 新 疆 北部 地 区 的 降水 与 北 冰 


纵 坐 标 表 示 IMF 分 量 的 能 量 谱 密 度 的 自然 对 数 。 
图 4 1965 一 2019 年 天 山北 坡 经 济 带 降 水 量 各 IMF 
分 量 的 显著 性 检验 


洋 涛 动 指数 (Aretic Oscillation Index,AOT) 在 准 3a 
周期 的 频 域 上 对 应 很 好 ,以 上 研究 结果 与 本 文 的 准 


Fig.4 Significance test of IMF components of precipitation 周期 结果 相 吻 合 。 
in the Northern Slope Economic Belt of Tianshan Mountains 2.2.2 LSTM 网 络 模型 训练 ”LSTM 网 络 结构 根据 变 
from 1965 to 2019 量 个 数 .输入 层 时 间 步 长 及 预测 的 时 间 步 长 确定 ， 
网 络 模型 的 变量 只 有 降水 量 , 因 此 变量 个 数 为 1。 
表 1 各 分 量 准 周期 及 方差 贡献 率 输入 层 的 时 间 步 长 以 EEMD 分解 后 各 分 量 的 周期 作 
Tab.1 Quasi period and variance contribution rate 为 依据 ,上 且 时 间 步 长 应 大 于 分 量 的 周期 小 于 原始 数 
Mheomponen 所 的 长 度 。 根 据 此 要 求 ,参照 IMF, 分 量 16a 的 准 周 
E EA 期 ,确定 输入 层 的 时 间 步 长 为 17。 模 型 的 输出 时 间 
i v 步 长 由 预测 年 份 的 时 间 长 度 决定 , 故 输出 时 间 步 攻 

IMF; 16.0 7/15 为 10。 


IMF, 51.2 0.45 LSTM 网 络 训练 使 用 的 激活 函数 为 ReLU ,网 络 
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的 优化 函数 为 Adam 函数 ,损失 函数 的 目标 为 均 方 
根 误差 。 预 防 过 拟 合 的 方法 采用 Dropout 方 法 ,以 提 
高 LSTM 网 络 的 泛 化 能 力 。LSTM 网 络 的 超 参 数 通 
过 试 次 实验 确定 。 超 参数 实验 的 设计 思路 为 固定 
两 个 超 参 数 , 试 竣 剩 余 的 一 个 超 参 数 , 将 训练 出 的 
LSTM 网 络 预测 值 与 验证 数据 集 进 行 对 比 ,选择 均 
方 根 误差 最 小 的 值 对 应 的 超 参数 。 最 终 LSTM 网 络 
的 超 参 数 如 表 2 所 示 。 


表 2 各 分 量 序列 LSTM[ 网络 的 超 参 数 
Tab.2 The hyperparameters of LSTM network 


with each component sequence 


分 量 隐藏 层 单元 数 /个 训练 次 数 /次 Dropout 
IMF, 160 30000 0.5 
IMF: 100 600 0.5 
IMF; 16 5000 0.1 
IMF, 16 1000 0.2 
RES 128 10000 0.5 


注 :Dropout 表 示 神 经 网 络 单元 被 丢弃 的 概率 值 。 


2010 2013 2016 2019 
年 份 
240 (c) MF; 一 一 观测 值 
190 --x-- 预测 值 


2010 2013 2016 2019 
年 份 


(e) RES 


—60 
2010 2013 


图 5 EEMD 分 解 后 各 分 量 的 预测 结果 
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2.2.3 EEMD-LSTM 耦合 模型 的 测试 与 评估 利用 
构建 的 EEMD-LSTM 耦合 模型 ,预测 天 山北 坡 经 济 
带 2010 一 2019 年 年 降水 量 , 进 而 评估 模型 效果 。 图 
5 为 各 分 量 序列 的 预测 值 与 观测 值 的 对 比 情况 。 
IMF, 至 IMF: 及 趋势 项 的 均 方 根 误差 分 别 为 12.18 
mm.,28.82 mm 7.08 mm,1.85 mm 2.18 mm, 

将 各 分 量 的 预测 结果 求 和 ,重建 天 山北 坡 经 济 
带 2010 一 2019 年 年 降水 量 的 预测 值 , 并 计算 得 出 各 
年 的 绝对 误差 .相对 误差 和 距 平 同 号 情况 ( 表 3)。 
从 表 3 可 以 看 出 ,天 山北 坡 经 济 带 2010 一 2019 Æ, 
EEMD- LSTM 耦合 模型 预测 的 相对 误差 最 小 为 
3.89% ,出 现在 2013 年 ,最 大 为 30.79% ,出 现在 2019 
年 ,前 5$ a 平均 相对 误差 为 7.88%, 后 5 a 的 平均 相对 
误差 为 18.87% , 10 a 的 平均 相对 误差 为 13.38%, 均 
方 根 误差 为 38.03 mm, 距 平 同 号 率 为 60%。 根 据 平 
均 相 对 误差 的 结果 及 距 平 同 号 情况 来 看 ,该 模型 对 
超过 5 a 的 降水 量 预测 能 力 明 显 下 降 , 但 依据 平均 相 
对 误差 预测 精度 的 分 级 标准 '™ ,平均 相对 误差 介 于 


(b) IMF, 一 一 观测 值 


--x-- 预测 值 


0 
2010 2013 2016 2019 
年 份 
jan (d) IMF, 一 < 一 观测 值 
--x- BUR 


-60 
2010 2013 2016 2019 
一 全 观测 值 
--X-- 预测 值 
2016 2019 
年 份 


Fig. 5 Prediction results of each component after EEMD decomposition 


202109.00050v1 


chinaXiv 


ChinaXiv 合 作 期 刊 


1240 干旱 区 研究 38 卷 


表 3 2010—2019 年 天 山北 坡 经 济 融 年 降水 量 LSTM 网 络 预测 结果 
Tab.3 LSTM network prediction results of annual precipitation in the Northern Slope Economic Belt of Tianshan 
Mountains from 2010 to 2019 


10%~20% 的 预测 效果 较 好 ,认为 EEMD-LSTM 耦合 HRS, 采用 自 回归 差分 滑动 平均 (ARIMA) 模 型 进 
模型 的 整体 预测 效果 较 好 。 行 研究 区 降水 量 的 预测 ,结果 表明 , ARIMA 模型 对 


2010 年 2011 年 2012 年 2013 年 2014 年 2015 年 2016 年 2017 年 ”2018 年 2019 年 
绝对 误差 /mm 16.44 17.48 37.22 9.07 9.38 59.48 52.35 20.17 39.3 64.04 
相对 误差 /% 5.98 741 17.75 3.89 4.37 20.08 17.18 9.27 17.04 30.79 
距 平 符号 同 号 同 号 异 号 同 号 同 号 同 号 同 号 异 号 异 号 异 号 


由 于 LSTM 网 络 的 输入 步 长 为 17, 模 型 预测 的 1982 一 2019 年 年 降水 量 预测 的 平均 绝对 误差 为 


时 间 序 列 为 1982 一 2019 年 共 37 a 的 降水 量 数据 。 84.76 mm, 均 方 根 误差 为 102.97 mm ,平均 相对 误差 
从 图 6 可 以 看 出 ,LSTM 网 络 对 天 山北 坡 经 济 带 为 38.69% ,3 种 误差 值 均 远 远大 于 EEMD-LSTM $8 
1982 一 2019 年 年 降水 量 的 预测 效果 整体 较 好 ,平均 。” 合 模 型 , 即 EEMD-LSTM 耦合 模型 的 预测 效果 优 于 
绝对 误差 为 22.17 mm , 均 方 根 误差 为 26.95 mm, © ”传统 模型 。 

均 相 对 误差 为 9.56% ,中 平 同 号 率 为 81.58%,38 a 中 利用 配对 样本 7 检验 ,验证 模型 的 预测 值 与 观 
共有 25 a 的 预测 相对 误差 小 于 10% ,集中 出 现在 。” 测 值 是 否 存在 显著 差异 。 结 果 显 示 , 两 样本 的 相关 
1982 一 2007 年 ,而 2015 年 .2016 年 和 2019 年 的 预测 。 系数 为 0.787, 具 有 显著 相关 性 ,同时 从 配对 样本 7 
效果 较 差 ,主要 原因 由 于 EEMD-LSTM 耦合 模型 对 ”检验 中 可 以 看 出 ( 表 4) ,配对 样本 差 值 的 平均 值 为 
降水 量 突变 的 情况 预测 效果 较 差 , 而 数据 显示 IMF， 3.24 mm, 在 95% 的 置信 区 间 内 , 双 尾 检验 的 尾 概率 
分 量 在 2016 年 的 方差 变化 较 大 ,从 而 增加 了 模型 的 (E P=0.47>0.05 , 故 认 为 基于 EEMD-LSTM 耦合 模型 
预测 误差 。 预测 天 山北 坡 经 济 带 降水 量 的 预测 值 和 观测 值 之 


一 步 比 较 传 统 方法 和 EEMD-LSTM 方 法 间 不 存在 明显 的 差异 。 


450 一 X 一 ARIMA 预 测 
" --a-- EEMD-LSTM 预 测 
一 -一 观测 值 


E 300 J| li n T" T AÀ DN YN a 
: » d W um AE Ay? WI Br [^ a 


1982 1984 1986 1988 1990 1992 1994 1996 1998 2000 2002 2004 2006 2008 2010 2012 2014 2016 2018 
年 份 


图 6 1982 一 2019 年 天 山北 坡 经 济 带 年 降水 量 的 模型 预测 结果 与 实际 数据 对 比 
Fig.6 Comparison of model prediction results and actual data of annual precipitation in the Northern Slope Economic 
Belt of Tianshan Mountains from 1982 to 2019 


表 4 LSTM 网 络 预 测 值 与 观测 值 在 测试 集 内 的 配对 样本 7 检验 
Tab.4 Paired sample 7-test table of LSTM network predicted value and observed value in test set 
配对 差 值 


差 值 的 95% 置 信 区 间 T 自由 度 。 显著 性 ( 双 尾 ) 
下 限 ER 


平均 值 标准 偏差 标准 误差 


预测 值 与 观测 值 3.24 27.12 4.39 —5.68 12.15 0.74 37 0.47 
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224 天 山北 坡 经 济 带 年 降水 量 预测 ”利用 EEMD- 
LSTM 耦合 模型 对 2020 一 2029 年 天 山北 坡 经 济 带 年 
降水 量 进行 预测 ( 表 $) ,2020 一 2029 年 中 有 6a 降 水 
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偏 多 ,4 a 降水 偏 少 ,其 中 2025 年 的 降水 量 为 未 来 
10 a 的 最 大 值 , 降 水 偏 比 多 年 平均 偏 多 20%; 而 2021 年 
为 未 来 10a 降 水 量 最 小 的 年 份 ,降水 量 低 于 200 mm。 


表 5 2020—2029 年 天 山北 坡 经 济 融 年 降水 量 LSTM 网 络 预测 结果 
Tab. 5 LSTM network forecast results of annual precipitation in the Northern Slope Economic Belt of 
Tianshan Mountains from 2020 to 2029 


20204 2021 年 2022 年 20234 20244 20254 20264 20274 ” 2028 年 20294 
降水 量 /mm 218.8 192.81 263.12 237.89 208.8 277.6 213.95 236.3 242.2 239.59 
距 平 百分率 /% -5.38 -16.62 13.78 2.87 -9.71 20.04 7.48 2.18 4.74 3.61 
丰 枯 情况 偏 少 偏 少 偏 多 偏 多 偏 少 偏 多 偏 少 偏 多 偏 多 偏 多 


3 讨论 


天 山北 坡 降 水 量 的 年 际 与 年 代 际 变化 ,主要 受 
北半球 中 高 纬度 环流 的 影响 ,对 AO NAO 等 大 尺度 
扰动 有 同 频 响应 。 有 学 者 研究 发 现 AO 存在 准 3 a、 
准 8a. 准 16a 周 期 ,NAO 存 在 准 8a 周 期 下 。 这 些 
大 气 遥 相关 型 与 本 文通 过 研究 区 年 降水 量 EEMD 分 
解 所 得 的 IMF 分 量 在 频率 上 基本 一 致 ,由 此 可 以 看 
tH, EEMD 能够 自 适应 地 提取 出 降水 量 信号 中 不 同 
时 间 尺 度 的 信息 ,分 解 后 的 分 量具 有 一 定 的 物理 意 
义 。 同 时 EEMD 也 将 非 平稳 的 时 间 序 列 转变 为 多 个 
平稳 分 量 及 趋势 项 之 和 ,为 后 续 建 模 英 定 了 良好 的 
基础 。 

神经 网 络 模型 能 够 拟 合 任意 的 非 线 性 关系 , 适 
用 于 降水 量 的 建 模 预 测 。 而 神经 网 络 模型 泛 化 能 
力 偏 低 , 当 数据 形态 变化 较 大 时 ,长 期 预测 精度 将 
显著 降低 »。 因 此 ,平稳 化 的 数据 对 神经 网 络 模型 
预测 精度 的 提升 有 着 积极 的 意义 ,同时 说 明了 
EEMD 与 LSTM 网 络 结合 建 模 的 必要 性 。 本 文 建立 
的 耦合 模型 对 研究 区 降水 量 的 预测 效果 较 好 ,但 仍 
有 值得 完善 和 提升 的 空间 ,下 一 步 工 作 中 利用 再 分 
析 格 点 资料 和 大 气 环流 因子 作为 模型 的 输入 变量 ， 
丰富 输入 数据 的 类 型 。 


4 结论 

本 文 建 立 了 EEMD-LSTM 耦合 模型 ,对 天 山北 
坡 经 济 带 年 降水 量 进 行 预测 研究 。 首 先 通过 对 天 
山北 坡 经 济 带 16 个 站 点 1965 一 2019 年 的 降水 量 数 
据 进 行 EEMD 分解 ,将 非 平稳 的 降水 量 序列 分 解 成 
了 4 个 平稳 的 本 征 模 态 函 数 分 量 和 1 个 趋势 项 , 根 


据 谱 分 析 得 出 天 山北 坡 经 济 带 的 降水 量 序列 存在 
准 2.9 a VE 7.5 a E 16 a 的 周期 变化 。 然 后 通过 构 
建 LSTM 网 络 模型 进行 研究 区 年 降水 量 预测 ,预测 
结果 表明 ,该 耦合 模型 的 平均 相对 误差 介 于 10%-~ 
20% 之 间 ,根据 平均 相对 误差 预测 精度 的 分 级 标准 ， 
本 文 建立 的 EEMD-LSTM 耦合 模型 预测 效果 较 好 ， 
且 优 于 传统 的 ARIMA 模型 ,该 研究 为 新 疆 降 水 量 预 
测 方法 提供 了 新 的 思路 和 途径 。 
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Prediction of annual precipitation in the Northern Slope Economic 
Belt of Tianshan Mountains based on a EEMD-LSTM model 
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Abstract: Precipitation prediction is both an essential and challenging component of modern climate prediction. 
In the precipitation prediction in Xinjiang, the research and application of coupling models are very limited. 
Therefore, this paper attempts to establish the ensemble empirical mode decomposition (EEMD) and long short- 
term memory (LSTM) neural network coupling models to predict precipitation in the Northern Slope Economic 
Belt of Tianshan Mountains. Firstly, the precipitation data recorded in the study area during 55 years, from 1965 
to 2019, were decomposed into four stationary components and trend terms using the EEMD, and the quasi 
period of each component was obtained by spectral analysis, which provided the basis for the subsequent training 
of the LSTM model. Then, each EEMD component was trained into the LSTM network model, and the models 
were used for predictions. The reconstruction and comparison of the results revealed that the average relative 
error and root mean square error of the 2010-2019 model were 13.38% and 38.03 mm, respectively. Therefore, it 
is inferred that the EEMD-LSTM coupling model can achieve a better precipitation prediction accuracy in the 
study area. The model was used to predict annual precipitation in the Northern Slope Economic Belt of Tianshan 
Mountains from 2020 to 2029; within this period, six years presented more and four years presented less 
precipitation. Year 2025 is predicted to be an extremely humid year with more than 20% of precipitation in 
excess; while 2021 is anticipated as an extremely dry year, with expected precipitation amounting to less than 200 
mm. This study explored a new method of precipitation prediction in an arid area, and provided a reference for 
meteorological disaster prevention and mitigation. 

Keywords: ensemble empirical mode decomposition; long short-term memory network; annual precipitation; 
prediction 


